iT邦幫忙

2022 iThome 鐵人賽

DAY 11
0
Software Development

歡迎來到 GIS 的世界!30 天從後端開始學 GIS系列 第 11

一起來用 GDAL 處理 Shapefile 吧! - 2 中文亂碼

  • 分享至 

  • xImage
  •  

文章同步發表至 Medium

上一篇提到,輸出的結果中,欄位的名稱可以正常顯示,內容的值卻會變成亂碼。

上網找解法的時候發現有人遇到相似的狀況,但不同的是,我和對方的亂碼顯示是相反的:他的亂碼會出現在欄位名稱,內容的值反而是正常的。

雖然狀況有點不相同,但他提出了一套說法:

對比 GetNameGetFieldAsString 兩個函數可以很明顯看出來,GetFieldAsString 通過調用 Ogr.Utf8BytesToString 將返回的 UTF8 編碼的位元組數組以 UTF8 方式解碼為字元串,所以能夠正常顯示;而 GetName 則直接返回字元串(實際上編譯器隱性調用了 Encoding.Default.GetString 解碼為字元串),由於沒有使用 UTF8 解碼導致顯示為亂碼。

真的是這樣嗎?

為了證明,我利用反編譯的工具來檢視 Gdal.Core.dll,可以看到像下面這樣的內容:

從這兩張圖中可以看到,讀取內容值,調用 Feature.GetFieldAsString() 的時候,會將結果進行轉換,Utf8BytesToString() 的內容包含:

所以從結論來看,他的情況應該是正常的,只是不知道為甚麼我會是相反的狀況:有用 UTF8 解碼的內容,反而會是亂碼 ?

新的希望

按照他的假設和他實際遇到的情況,應該是要在取得欄位名稱的時候多調用 Utf8BytesToString() 來讓字串正確顯示。但對於我的狀況來說,反而是要把 Utf8BytesToString() 拿掉 ?

這件事對於沒有點 dll 和 C++ 技能的我來說有點困難,所以選擇放棄 Gdal.Core 這個套件,轉而使用另外一個使用 Gdal ,但是是專門開發給 .NET Core 使用的套件--MaxRev.Gdal.Core

套件 版本 備註
MaxRev.Gdal.Core 3.3.3.120
MaxRev.Gdal.WindowsRuntime.Minimal 3.3.3.120 Windows 系統專用
MaxRev.Gdal.LinuxRuntime.Minimal 3.3.3.120 Linux 系統專用

改寫讀取

套件的使用方法和原本的 Gdal.Core 一模一樣,只是要在原本的 Gdal.AllRegister(); 之前,加上 GdalBase.ConfigureAll(); 就可以了。

記得要先把舊有的 Gdal.Core 移除掉喔。

// 加上這一行
GdalBase.ConfigureAll();

// 原本的註冊
Gdal.AllRegister();
Ogr.RegisterAll();

更改套件之後運行的結果如下:

成功還原情況了!

修正中文亂碼

將情境還原之後就可以針對他所提出的方法進行修正了。我選擇的是第三個方法:直接調用原本 dll 中的方法,再另外包一層 UTF8 解碼。

完整的程式碼如下:

// 註冊 MaxRev.Gdal.Core
GdalBase.ConfigureAll();

// 註冊 GDAL
Gdal.SetConfigOption("SHAPE_ENCODING", "big5");
Gdal.AllRegister();
Ogr.RegisterAll();

// 開啟 SHP 檔案(0 - 讀取、1 - 讀寫)
var source = Ogr.Open("files/simple/test.shp", (int)EnumShapefileOpen.ReadOnly);
var layerCount = source.GetLayerCount();
for (var i = 0; i < layerCount; i++)
{
    // 讀取圖層 Layer 資訊
    var layer = source.GetLayerByIndex(i);
    var fieldCount = layer.GetLayerDefn().GetFieldCount();
    for (var j = 0; j < fieldCount; j++)
    {
        var field = layer.GetLayerDefn().GetFieldDefn(j);
        
        // 這裡調用新的方法
        var fieldName = GetFieldDfnName(field);
        Console.WriteLine($"欄位{j + 1}. {fieldName}");
    }
    
    // 讀取要素 Feature
    Feature feature;
    while ((feature = layer.GetNextFeature()) != null)
    {
        var id = feature.GetFieldAsInteger(0);
        Console.WriteLine($"內容1. {id}");
        
        var name = feature.GetFieldAsString(1);
        Console.WriteLine($"內容2. {name}");
        
        var area = feature.GetFieldAsInteger64(2);
        Console.WriteLine($"內容3. {area}");
        
        var geometry = feature.GetGeometryRef();
        geometry.ExportToWkt(out var wkt);
        Console.WriteLine($"- WKT: {wkt}");
    }
}

static string? Utf8BytesToString(IntPtr ptr)
{
    if (ptr == IntPtr.Zero)
        return null;

    var ms = new MemoryStream();
    byte b;
    var ofs = 0;
    while ((b = Marshal.ReadByte(ptr, ofs++)) != 0)
    {
        ms.WriteByte(b);
    }
    return Encoding.UTF8.GetString(ms.ToArray());
}

// Dll 的位置要注意
[DllImport("gdal/x64/gdal305.dll", EntryPoint = "OGR_Fld_GetNameRef", CallingConvention = CallingConvention.Cdecl)]
static extern IntPtr OGR_Fld_GetNameRef(HandleRef handle);
static string GetFieldDfnName(FieldDefn fieldDefn)
{
    HandleRef handle = FieldDefn.getCPtr(fieldDefn);
    IntPtr ptr = OGR_Fld_GetNameRef(handle);
    return Utf8BytesToString(ptr);
}

public enum EnumShapefileOpen
{
    ReadOnly
}

修復成功的結果:

References


上一篇
一起來用 GDAL 處理 Shapefile 吧! - 1 建立
下一篇
一起來用 GDAL 處理 Shapefile 吧! - 3 建立
系列文
歡迎來到 GIS 的世界!30 天從後端開始學 GIS30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言